No início das epidemias o número de infectados cresce exponencialmente, o que implica que o tempo para que o número de casos duplique é constante em \(\ln(2)/r\), onde \(r\) é a taxa de crescimento de número de casos. Um crescimento exponencial a taxa constante também implica em uma relação linear entre o logaritmo do número de casos e o tempo. Essa expectativa em geral vale para pequenos intervalos de tempo, na fase inicial de epidemias. É o que vemos para o Brasil, por exemplo, nos cincos dias a partir do dia em que o número de casos chegou a 15 (gráfico ao lado)
A linha reta no gráfico mostra o previsto por um modelo linear em escala log para dados de contagem 1, ajustado a estes dados. Esse modelo estima o valor da taxa de crescimento da epidemia neste período (\(r\)), com a qual estimamos o tempo de duplicação.
ln do n de casos de COVID-19 no Brasil, entre 07 e 12 de março de 2020
Com o modelo linear ajustado estimamos o número de casos para os próximos dias, e os intervalos de confiança dos valores previstos (gráfico ao lado).
A extensão da reta de regressão está abaixo dos pontos do número de casos dos próximos cinco dias. Isso mostra que o coeficiente de crescimento exponencial pode variar mesmo na fase inicial da epidemia, o que torna extrapolações de longo prazo muito sujeitas a erros. Apesar disso, o intervalo da previsão do modelo incluiu os números de casos dos cinco dias seguintes, mostrando que essa regressão é útil para fazer previsões de curto prazo.
ln do n de casos de COVID-19 no Brasil, entre 07 e 12 de março e valores previstos de 12 a 16 de março de 2020.
Para avaliar o quanto o crescimento da epidemia varia ao longo do tempo, ajustamos o modelo linear para períodos de cinco dias, a partir de quando foram registrados 15 casos. Estimamos o tempo de duplicação e o respectivo intervalo de confiança para cada um desses modelos. Assim, a primeira estimativa é para o período de r format(min(time(brasil.d0)), "%d de %B") a r format(min(time(brasil.d0))+5, "%d de %B"). A segunda é para o período de 08 de março a r format(min(time(brasil.d0))+6, "%d de %B") e assim sucessivamente. A tabela ao lado exemplifica os resultados obtidos para os primeiros 10 dias a partir do dia com 15 casos:
| Estimado | IC-inferior | IC-superior | |
|---|---|---|---|
| 2020-03-11 | 2,885954 | 5,430057 | 1,950872 |
| 2020-03-12 | 2,309658 | 3,433717 | 1,729527 |
| 2020-03-13 | 2,158832 | 2,945698 | 1,695579 |
| 2020-03-14 | 2,318593 | 3,086497 | 1,849847 |
| 2020-03-15 | 2,138650 | 2,652016 | 1,786956 |
| 2020-03-16 | 2,345136 | 2,867748 | 1,979614 |
Em epidemiologia, uma das medidas mais importantes é o número reprodutivo basal ou razão de reprodução básica (\(R_0\)). Essa medida indica o número de casos secundários que um indivíduo infeccioso pode gerar em uma população totalmente suscetível. Apesar de ser muito útil para avaliar o potencial de propagação de doenças infecciosas em diferentes contextos, \(R_0\) é uma medida teórica. Com a propagação de doenças infecciosas com altas taxas de transmissibilidade, muitas pessoas se infectam e, em diversos casos, indivíduos que já foram infectados podem tornar-se resistentes, não pertencendo mais ao grupo de suscetíveis. Neste momento, a premissa de uma população totalmente suscetível passa a não ser mais uma boa aproximação da realidade e uma nova medida epidemiológica faz-se necessária. Essa medida é o número reprodutivo efetivo ou razão de reprodução efetiva (\(R_e\)). Esse número indica o número de casos secundários produzidos em uma população na qual nem todos são suscetíveis.
Para analisar a dinâmica instantânea de uma doença infecciosa que tem potencial de infectar grande parte da população, o valor de \(R_e\) calculado ao longo do tempo pode informar o quão crítico é o atual estágio de uma epidemia. Podemos calcular o \(R_e\) utilizando séries temporais de dados de incidência (novos casos a cada dia, semana, etc) e a distribuição do intervalo serial, definido como o intervalo de tempo entre o início da doença em um caso primário e o início da doença em um caso secundário. O intervalo serial é uma medida difícil de ser obtida, principalmente para doenças infecciosas com pouco estudo epidemiológico. Para contornar esse problema, pode-se estimar o valor de \(R_e\) considerando incertezas na medida do intervalo serial.
Usamos a série temporal dos últimos 7 dias da epidemia de COVID-19 para estimar diariamente os valores de \(R_e\), utilizando a metodologia de Wallinga e Teunis (2004) e implementada no pacote EpiEstim do software R (Cori 2020). Para a medida de intervalo serial, utilizamos uma distribuição log-normal truncada com média 4.8 (IC 95%, 3.8 - 6.1) e desvio padrão 2.3 (IC 95%, 1.6 - 3.5) em conformidade com o estudo Nishiura et al. (2020).
Resultado das análises utilizando dados brasileiros da epidemia de Covid-19.
Ane Cori (2019). EpiEstim: Estimate Time Varying Reproduction Numbers from Epidemic Curves. R package version 2.2-1. https://CRAN.R-project.org/package=EpiEstim
Wallinga J and Teunis P. Different Epidemic Curves for Severe Acute Respiratory Syndrome Reveal Similar Impacts of Control Measures, American Journal of Epidemiology, Volume 160, Issue 6, 15 September 2004, Pages 509–516, https://doi.org/10.1093/aje/kwh255
Nishiura H, Linton NM, Akhmetzhanov AR, Serial interval of novelcoronavirus (COVID-19) infections. International Journal of Infectious Diseases, 2020. doi: https://doi.org/10.1016/j.ijid.2020.02.060
Modelo linear generalizado Poisson (glm), com função de ligação logarítimica.↩︎